home *** CD-ROM | disk | FTP | other *** search
/ SuperHack / SuperHack CD.bin / Hack / MISC / SWEDIS~1.ZIP / SWEDIS~1 / swedish / README < prev    next >
Encoding:
Text File  |  1992-04-06  |  3.5 KB  |  98 lines

  1.  
  2. FILE: swedish.words
  3. VERSION: DEC-SRC-92-Apr-05
  4.  
  5. EDITOR
  6.  
  7.     Jorge Stolfi <stolfi@src.dec.com>
  8.     DEC Systems Research Center
  9.     
  10. AUTHOR OF ORIGINAL WORDLIST
  11.  
  12.     Unknown.
  13.   
  14. DESCRIPTION
  15.  
  16.     The file swedish.words is a list of about 15,000 Swedish words.
  17.  
  18.     The file has one word per line, and is sorted with sort(1)
  19.     in plain ASCII collating sequence.
  20.  
  21.     The file is supposed to contain all word inflections and verb
  22.     tensens, but it is still extremely incomplete (as one can deduce
  23.     from its size).
  24.  
  25.     Proper nouns are capitalized.  Umlauts and circle-accents are
  26.     respectively denoted by a double quote (") and at-sign (@) after
  27.     the modified vowel (A/O/a/o).  Besides the letters [a-zA-Z], the
  28.     file uses only double quotes, at-sign, and newline.
  29.  
  30. AUXILIARY LISTS
  31.  
  32.     In the same directory as swedish.words you will find also:
  33.  
  34.     swedish.trash
  35.  
  36.         A list of 8744 words from the original wordlist that I 
  37.         suspect are incorrect or do not belong in swedish.words.  
  38.  
  39.         The list consists mostly of (invalid) un-accented versions of
  40.         accented letters.  The list also includes abbreviations,
  41.         acronyms, computer slang, obvious typos and misspelllings,
  42.         apparently foreign words, and several words that looked
  43.         suspicious to me.
  44.  
  45. ORIGINAL LISTS 
  46.  
  47.     The original wordlist from which those file was compiled is listed
  48.     below.  It was obtained by anonymous FTP on 92-Feb-10.
  49.  
  50.     [1] from: relay.cs.toronto.edu : /doc/Dictionaries
  51.         file: words.swedish.Z
  52.         size: 96169 bytes (200853 bytes uncompressed)
  53.  
  54.     COMMENTS: The list words.swedish.Z [1] uses the characters {}|[]\
  55.     to represent accented letters.  However, the list also appears to
  56.     include two additional (invalid) versions of every accented word,
  57.     where the umlauts and circle-accents are either missing or encoded
  58.     by digrams (ae/aa/oe/Ae/Aa/Oe). 
  59.  
  60. COMPILATION PROCESS    
  61.  
  62.     The file swedish.words is based on the the file "words.swedish"
  63.     [1], with the characters {}|[]\ mapped to to the letter-accent
  64.     pairs (a"/a@/o"/A"/A@/O").
  65.  
  66.     I also eliminated every word that could be an accentless version
  67.     of an accented word. Since I don't know the language, it is
  68.     likely that I deleted some valid words.
  69.  
  70. (NON-)COPYRIGHT STATUS
  71.  
  72.   To the best of my knowledge, all the files I used to build these
  73.   wordlists were available for public distribution and use, at least
  74.   for non-commercial purposes.  I have confirmed this assumption with
  75.   the authors of the lists, whenever they were known.
  76.   
  77.   Therefore, it is safe to assume that the wordlists in this package
  78.   can also be freely copied, distributed, modified, and used for
  79.   personal, educational, and research purposes.  (Use of these files in
  80.   commercial products may require written permission from DEC and/or
  81.   the authors of the original lists.)
  82.   
  83.   Whenever you distribute any of these wordlists, please distribute
  84.   also the accompanying README file.  If you distribute a modified
  85.   copy of one of these wordlists, please include the original README
  86.   file with a note explaining your modifications.  Your users will
  87.   surely appreciate that.
  88.  
  89. (NO-)WARRANTY DISCLAIMER
  90.  
  91.   These files, like the original wordlists on which they are based,
  92.   are still very incomplete, uneven, and inconsitent, and probably
  93.   contain many errors.  They are offered "as is" without any warranty
  94.   of correctness or fitness for any particular purpose.  Neither I nor
  95.   my employer can be held responsible for any losses or damages that
  96.   may result from their use.
  97.  
  98.